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100049) 
中 能 X 射线 望远镜 及 天 宫 二 号 上 伯 玛 暴 偏振 探测 仪 为 例 ， 详 细 介 绍 了 数据 的 预 处 理 步骤 和 
天 文 卫 星 数据 处 理 系统 的 研制 具有 参考 意义 。 
关键 词 ， 预 处 理 ， 卫 星 数 据 ， 数 据 解 包 ; 时 间 计 算 
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摘要 : 天 文 卫 星 获取 的 数据 需要 经 过 一 系列 操作 生成 可 以 发 布 给 科学 用 户 的 数据 产品 ， 
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数据 预 处 理 是 其 中 比较 重要 的 环节 ， 它 是 数据 发 布 的 基础 。 以 硬 义 射线 调制 望远镜 卫星 的 


方法 。 提 出 了 一 套数 据 预 处 理 的 步骤 ， 并 给 出 数据 解析 的 策略 和 时 间 计 算 方法 等 


文章 编号 : 1672-7673(2017)03-0376-06 


这 对 中 国 
卫星 载荷 获取 的 科学 数据 按 预 定义 的 格式 在 数据 管理 系统 组 包 后 发 送 给 卫星 平台 ， 这 些 数据 连同 


平台 采集 的 数据 通过 数 传 通道 下 传 至 地 面 ， 经 过 简单 的 解码 、 去 重复 、 分 组 等 发 送 给 卫星 的 科学 系 


统 。 这 些 数据 是 采用 国际 数据 系统 咨询 委员 会 “标准 的 数据 包 ， 它 们 要 经 过 解 包 、 转 换 、 事 例 组 装 
时 间 计 算 、 文 件 拆 分 和 合并 等 处 理 步 骤 ， 生 成 可 供 进 一 步 处 理 的 数据 单元 ， 因 为 这 里 一 般 不 涉及 标定 


等 处 理 ， 所 以 称 之 为 数据 预 处 理 系 统 。 不 同 卫星 载 答 的 数据 尽管 在 处 理 细节 上 不 尽 相 同 , 但 是 大 都 需 


要 这 样 的 处 理 ”* ， 比 如 Swit 卫星 ， 下 传 的 数据 经 过 数据 解 包 转换 为 FITS 格式 “| ， 在 数据 分 析 中 
计算 时 间 等 。 在 数据 分 析 之 前 ， 建 立 一 套 标准 的 处 理 流程 ， 必 将 为 其 它 卫 星 提 供 
x 射线 调制 望远镜 卫星 ' ”1 的 中 能 X 射线 望远镜 ( Medium Energy X-ray Telescope, ME) 及 天 


其 完整 
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13:3 25 Die AOI SUO 为 例 说 明 数 据 预 处 理 系统 的 处 理 步 又 及 方法 ， 希 望 给 出 一 套 标准 的 步 又 和 方法 。 


数据 预 处 理 中 5 根据 数据 的 来 源 及 功能 ， 处 理 的 数据 分 为 : (1) 科学 事例 数据 ( Event Files, 
EVTF) ， 主 要 是 载荷 记录 的 光子 信息 ; (2) 工 程 数据 (Instrument Housekeeping Files, HKF), RARE 
的 空间 环境 ， 比 如 进出 南大 西洋 异常 区 信息 


的 温度 、 电 压 等 信息 ; (3) 平 台数 据 (Platform Files, PLF) ， 卫 星 平 台 采 集 的 轨道 位 置 、 姿 态 等 。 在 预 
处 理 中 还 需要 产生 扩展 的 工程 文件 (EHK 文件 ，Extended Housekeeping Files, EHKF) ， 主 要 描述 卫星 


完整 。 l 
数据 预 处 理 系统 的 任务 : (1) 对 这 些 数据 包 进 行 校 验 ， 并 进行 数据 拆 分 或 者 合并 ， 解 析 包 中 的 信 
息 形 成 科学 事例 或 者 记录 ; (2) 找 出 科学 事例 的 完整 时 间 信息 ， 并 对 时 间 进 行 一 定 的 修正 ， 产 生 EHK 
理 的 卫星 数据 ， 输 出 的 是 1 级 数据 ，1A 
1 


的 。 科 学 数据 要 求 的 时 间 精 度 比 较 高 ， 时 间 来 源 也 比较 复杂 ， 为 了 节省 资源 ， 一 般 只 记录 低位 时 间 ， 


地 磁 截 止 刚 度 等 ， 这 些 文件 都 是 通过 时 间 信 息 进行 关联 
mih, ， 工 程 和 平台 数据 的 时 间 一 般 比 较 另外 ， 科 学 数据 的 存储 
不 一 定 按时 间 顺 序 ， 尤 其 是 来 自 不 同 电子 学 模块 的 数据 ， 而 工程 和 平台 的 数据 一 般 按时 间 顺 序 存储 。 


1B 和 1C 分 别 对 应 以 上 处 理 任务 。 
中 能 X 射线 望远镜 和 伽 玛 暴 偏振 探测 仪 介绍 


文件 ; (3) 产 生 可 供 进一步 处 理 的 完整 的 数据 文件 。 图 1 是 预 处 理 系 统 的 流程 ， 输 入 的 是 经 过 简单 处 
过 


中 能 X 射线 望远镜 采用 Si-PIN 阵列 ， 分 成 9 个 独立 工作 的 探测 单元 ， 每 个 单元 单独 打包 ， 然 后 
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再 循环 读 出 到 数据 管理 系统 。 事 例 只 记录 最 低 的 。 [一 一 
14 位 时 间 ， 高 位 时 间 通 过 进位 事例 记录 ， 同 时 aH a H oe H i m 


载荷 将 卫星 接收 的 GPS 秒 同 步 信 号 的 到 达 时 
间作 为 一 个 特殊 事例 (GPS 秒 脉 冲 事例 ， 同 时 记 B1 预 处 理 系统 的 流程 ， 其 中 1A，1IB 及 1C 为 其 中 的 


录 相对 应 的 低位 时 间 ) 插 入 数据 流 中 ， 稍 后 对 应 REPR, Level 0，1 分 别 表示 卫星 下 传 的 原始 娄 
的 GPS 秒 同步 时 间 ， 也 作为 一 个 特殊 事例 ( GPS Ife PER ACIE 可 发 布 的 教 据 ) 
秒 同 步 事 例 ) 插入 事例 流 中 。 Fig.1 Data flow diagram. Level O, 1 represent the input 


telemetered data and the output data ( can released to 


A545 28: D T 0 36 HH — A P o fü RER R AN 
25 个 探测 模块 组 成 。 中 心 触发 模块 记录 触发 时 
间 ( 中心 触 发 晶振 提供 ，32 位 时 间 码 ， 记 满 清 0) 及 25 个 探测 模块 的 触发 标志 ， 形 成 触发 包 ， 在 触发 
的 相应 模块 上 ， 记 录 23 位 时 间 码 (触发 电路 晶振 提供 ， 记 满 清 0) 及 触发 通道 ， 形 成 各 个 模块 的 独立 
数据 包 ， 因 此 伽 玛 暴 偏 振 探测 仪 预 处 理 的 一 个 重点 是 将 触发 包 与 之 相对 应 的 触发 模块 产生 的 数据 包 进 
行 匹 配 。 它 的 GPS 秒 同步 时 间 与 中 心 触发 晶振 的 对 应 关系 保存 于 工程 数据 中 ， 一 分 钟 更 新 一 次 。 

图 2 是 中 能 X 射线 望远镜 和 伽 玛 暴 偏振 探测 仪 的 数据 处 理 流程 。 本 文 重点 介绍 它们 的 数据 处 理 

- 流程 ， 并 介绍 其 中 的 主要 方法 。 
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(a) ME data reduction flow diagram (b) POLAR data reduction flow diagram 
图 2 中 能 X 射线 望远镜 和 伽 玛 暴 偏振 探测 仪 的 处 理 流 程 
Fig.2 ME and POLAR data flow diagram 


2 1A 级 数据 处 理 过 程 


该 过 程 主 要 对 所 有 数据 进行 解 包 ， 即 将 二 进 制 数据 按照 格式 解析 为 通用 的 十 进 制 位 数据 ， 同 时 对 
科学 数据 进行 一 定 的 处 理 ， 比 如 中 能 X 射线 望远镜 的 本 地 时 间 计 算 ( 利 用 内 部 晶振 表示 时 间 ， 可 以 看 
作 一 个 内 部 计数 ， 计 数 与 晶振 周期 之 积 表 示 时 间 长 度 ) ， 伽 玛 骏 仿 振 探 测 仪 事例 匹配 等 。 

2.1 数据 解析 方法 

一 个 数据 包 中 可 能 包含 多 个 不 同 的 数据 结构 ， 比 如 科学 事例 包 中 ， 中 能 X 射线 望远镜 包含 86 个 
相同 的 科学 事例 结构 ， 而 伽 玛 暴 侦 振 探测 仪 包含 5 种 不 同 科学 数据 结构 (1 种 触发 包 和 4 种 事例 包 ) 。 
数据 解析 是 将 包 中 的 所 有 数据 结构 解析 。 男 外 数据 包头 及 其 中 数据 结构 的 一 些 关 键 字 也 可 以 看 作 特 殊 
的 数据 结构 。 这 些 结构 的 定义 一 般 由 载荷 的 制造 者 设计 ， 软 件 人 员 按 照 设 计 逐 一 读 出 即 可 。 本 文采 用 
配置 文件 解析 的 方法 完成 数据 解析 。 配 置 文件 的 格式 如 表 1，ID 代表 标识 号 ，Title 为 待 解析 数据 的 名 
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称 ，Type 为 解析 横 式 ， 它 的 取 值 : 当 为 0 时 ， 如 表 1 配置 文件 格式 说 明 
果 Repeat 为 1， 则 将 FB-EB 指定 的 区 域 进 行 解 Table 1 The format of configure file for data decoding 
析 ， 如 果 Repeat AF 1 则 将 FB-EB 指定 的 区 域 Name Contents 
分 为 Repeat 份 ， 分 别 进行 解析 ; 当 为 1 时 ， 将 FB ID Id number 

-EB d&xE B POSU EHI E T, E F2B-E2B 指定 Title Title 

的 区 域 作 为 高 字 节 位 进行 解析 ; 当 为 2 时 ， 将 FB Type Decode pattern 

-EB 指定 的 区 域 进行 解析 E Step 为 步 长 跳 转 到 FB/EB Least significant word/byte/bit 
下 一 个 区 域 ( EB4Step*l, EB+Step+1+EB _FB) 进 nón Hn pln word/byte/ bit 

一 Y Loo ope h x Y pes t é te 
行 解析 ， 以 此 类 推 。 该 模式 下 数组 的 维 数 可 变 。 pori ood 

ag Bit/ Byte 


所 有 模式 下 ， 起 始 位 为 数据 结构 的 起 始点 。 
解析 按照 高 位 在 前 、 低 位 在 后 的 顺序 进行 ， 最 大 支持 的 解析 位 数 为 64 位 。 
数据 解析 过 程 : 读 和 上述 配 置 文件 ， 通 过 待 解析 数据 的 名 称 获 得 解析 变量 所 在 的 索引 ， 读 入 数据 ， 
根据 索引 找到 变量 所 在 的 起 始 位 置 等 属性 。 
2.2 解 包 策略 
中 能 X 射线 望远镜 和 伽 玛 暴 偏振 探测 仪 的 数据 都 按 数据 包 组 织 ， 每 一 次 只 能 解析 一 个 包 。 处 理 
的 策略 如 下 : 
(1) 检 查 包 序号 是 否 连 续 ， 对 包 进 行 循环 元 余 校 验 ( Cyclie Redundancy Check, CRC) ; 
co (2) 程序 开始 或 者 丢 包 发 生 时 ， 寻 找 关键 字 ， 确 定数 据 结构 的 开始 位 置 ， 比 如 伽 玛 暴 偏振 探测 仪 
的 一 个 数据 结构 可 能 分 到 两 个 数据 包 中 ; 
(3) 对 数据 包 进行 组 装 ， 使 之 形成 完整 的 数据 包 ; 
lu (4) 读 取 一 个 完整 的 数据 结构 ， 对 其 进行 循环 宛 余 校 验 ， 利 用 该 结构 的 配置 文件 进行 解析 ， 记 录 
N 数据 包 序号 、 打 包 时 间 ; 
c (5) 对 循环 兄 余 校 验 不 通过 的 均 不 进行 解析 而 舍弃 ， 对 不 完整 数据 结构 也 舍弃 ; 
AI (6) 数 据 的 存储 : 对 于 科学 事例 要 根据 后 续 的 处 理 功能 选择 是 首先 放 入 内 存 还 是 直接 写 入 文件 ， 
对 于 工程 数据 和 平台 数据 一 般 直接 写 和 文件。 数据 的 存储 还 要 考虑 方便 数据 文件 的 拆 分 和 合并 ， 比 如 
中 能 x 射线 望远镜 的 9 个 探测 器 单元 独立 打包 ， 在 数据 保存 的 时 候 采用 独立 保存 的 方法 (可 以 保存 为 独 
立 的 文件 ， 也 可 以 保存 为 独立 的 数据 区 ， 比 如 在 一 个 基于 ROOT 格式 "文件 中 保存 9 个 树 形 结构 ) 。 
2.3 ”中 能 X 射线 望远镜 时 间 计 算 及 伽 玛 暴 偏振 探测 仪 事例 匹配 
r= 影响 两 者 的 主要 因素 是 事例 丢失 及 数据 包 丢 失 ， 它 们 都 以 特殊 事例 为 参考 点 进行 处 理 。 
o 中 能 X 射线 望远镜 的 时 间 计算 是 指 利 用 进位 事例 及 事例 的 低位 时 间 信 息 将 事例 的 本 地 时 间 表 示 
出 来 ， 因 此 ， 寻 找事 例 的 高 位 信息 就 成 为 重点 。 时 间 计 算 的 参考 事例 为 相 邻 进位 事例 ， 主 要 方法 是 扫 
描 低 位 时 间 ， 记 录 翻转 次 数 ， 如 果 翻 转 次 数 与 相 邻 进位 一 致 ， 中 间 进 位 时 间 则 准确 得 到 ， 如 果 不 一 
致 ， 则 前 后 丢 包 的 数据 段 不 能 给 出 进位 时 间 。 如 果 处 理 的 数据 仅 有 一 个 进位 ， 则 需要 通过 向 后 或 者 向 
前 推断 时 间 ， 如 果 一 旦 出 现 丢 包 ， 则 后 续 事例 不 能 得 到 准确 的 时 间 。 
伽 玛 暴 偏振 探测 仪 事例 匹配 是 将 触发 包 与 其 对 应 的 事例 包 进 行 匹 配 ， 匹 配 后 触发 包 可 看 作 一 次 物 
理 过 程 。 时 间 计 算 以 基线 触发 包 和 基线 事例 包 为 参考 点 ,方法 是 计算 其 它 事例 相对 于 参考 点 的 时 间 
差 ， 如 果 触 发 包 相对 于 基线 触发 包 的 时 间 差 与 事例 包 相对 于 基线 事例 包 的 时 间 差 一 致 ， 且 触发 包 中 有 
该 模块 的 触发 标记 ， 则 认为 该 事例 包 属 于 触发 包 。 匹 配 到 新 的 基线 时 ， 则 更 新 参考 点 以 保证 不 受 电 子 
学 翻转 的 影响 。 表 2 是 一 段 已 经 匹配 的 结果 ， 其 中 第 1 个 记录 为 基线 ， 也 就 是 参考 点 。 基 线 的 确定 方 
法 为 在 事例 流 中 触发 包 在 前 ， 事 例 包 在 后 ， 先 假定 两 者 匹配 ， 检 查 前 后 其 它 非 基线 包 ， 如 果 匹 配 度 
(匹配 上 的 事例 与 检查 的 所 有 事例 之 比 ) 较 高 ， 则 认为 假定 正确 ， 和 否则 继续 寻找 。 
对 工程 数据 和 平台 数据 来 说 ，1A 级 数据 处 理 过 程 最 主要 的 是 解 包 ， 一 般 不 存在 特殊 处 理 ， 并 按 
解 包 顺 序 依 次 存储 ; 对 科学 数据 来 说 ， 该 过 程 包括 解 包 、 处 理 及 事例 分 类 存储 ， 处 理 需 要 保证 解析 正 
确 ， 在 存储 上 需要 考虑 以 后 合并 和 拆 分 的 要 求 ， 本 文 建议 分 单元 存储 。 
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A2 一 段 触发 包 与 事例 包 匹 配 的 结果 ， 其 中 第 1 个 记录 为 基线 信息 ，Flag 表示 触发 的 探测 模块 
Table 2 Corresponding relationship between data packets and trigger packet. The first list is from 
pedestal packet and flag means the triggered modules in trigger packet 


Trigger packet Data packet 
Local time (32bits ) High 23 bits Trigger flag Local time (23bits ) Module 
15562 43742 3039538 1-25 243995 1-25 
15562 45471 3039541 8 243998 8 
15562 78832 3039607 14 15 244063 14 15 


3 1B 级 数据 处 理 过 程 


3.1 GPS 时 间 计 算 

该 过 程 主 要 计算 事例 文件 中 事例 的 GPS 时 间 ， 并 将 所 有 文件 的 一 些 解析 量 转 换 为 实际 物理 量 。 
GPS 时 间 的 计算 需要 本 地 时 间 与 GPS 时间 的 一 个 对 应 关系 ( 称 之 为 对 应 点 关系 ) ， 并 且 需 要 知道 这 个 
对 应 点 使 用 的 时 间 段 (本 地 时 间 存 在 定期 清 零 ， 该 关系 称 之 为 对 应 段 关 系 ) ， 还 需要 知道 晶振 的 最 小 
时 间 周 期 ， 标 称 与 实际 可 能 存在 差异 ， 而 且 随 着 时 间 的 推移 及 温度 的 变化 ， 唱 振 频 率 也 会 发 生变 化 。 

中 能 X 射线 望远镜 的 时 间 计 算 中 已 经 计算 了 GPS 秒 脉冲 的 本 地 时 间 ， 这 可 以 看 作 GPS 时 间 与 本 
地 时 间 的 对 应 关系 。 伽 玛 暴 偏振 探测 仪 则 将 这 个 关系 写 和 人 HK 文件 ， 每 分 钟 更 新 。 但 是 中 能 X 射线 望 
远 镜 和 伽 玛 暴 偏振 探测 仪 的 这 种 对 应 关系 受 唱 振 及 GPS 不 稳定 影响 ， 如 果 进 行 一 定 的 修正 ， 效 果 更 
好 。 修 正 的 方法 是 将 这 些 对 应 点 进行 积累 ,分 别 计算 这 段 时 间 的 本 地 计数 差 AN" 和 GPS 时 间 差 
AN*”， 这 样 就 很 容易 得 到 时 钟 周期 = ANANA 及 平均 对 应 点 G+AN /2, N-AN"" 72. 其 中 G, 
NN 为 初始 的 GPS 起 点 和 本 地 计数 起 点 ， 利 用 这 些 信息 可 以 比较 好 地 计算 事例 的 GPS 时 间 T" = G + 
AN*772 +(N™-N-AN”"/2) #1t,，7T™,N"' 分 别 表示 事例 的 GPS 时 间 和 内 部 时 间 计 数 ， 具 体积 累 的 数 
据 量 与 载荷 的 温度 变化 程度 及 要 求 的 时 间 精 度 有 关 。 

中 能 X 射线 望远镜 的 进位 事例 是 一 直 累 积 的 ， 原 则 上 一 个 对 应 点 可 以 适用 于 所 有 的 数据 ， 但 是 
望远镜 可 能 会 重启 ， 这 样 进位 事例 记录 的 晶振 时 间 也 会 清 零 ， 而 伽 玛 暴 偏振 探测 仪 的 中 心 触发 模块 的 
时 钟 计数 器 会 定时 清 零 。 处 理 的 方法 是 : DA 级 处 理 过 程 中 记录 本 地 时 间 周 期 翻转 的 开始 和 结束 时 间 
ti ，t,， 此 时 间 可 以 利用 打包 时 间 表 示 ， 打 包 时 间 来 源 于 平台 时 间或 者 GPS 时 间 ， 并 对 该 时 间 段 内 的 
事例 做 标记 ， 建 立 该 时 间 段 与 事例 之 间 的 一 一 对 应 关系 ， 即 记录 事例 属于 第 几 个 时 间 段 ， 因 为 内 部 时 
间 翻 转 的 位 置 是 确定 的 ， 所 以 此 关系 唯一 ， 这 些 时 间 段 和 事例 都 保存 在 文件 中 。1B 级 处 理 过 程 中 首 
先 读 和 人 这些 时 间 段 ， 在 每 一 个 或 者 几 个 时 间 段 内 做 时 间 对 应 点 关系 ， 对 于 中 能 X 射线 望远镜 采用 积 
R GPS 事例 的 方法 ， 而 伽 玛 暴 偏振 探测 仪 则 需要 通过 积累 HK 文件 中 GPS 时 间 与 内 部 晶振 时 间 对 应 
关系 ， 进 而 得 到 对 应 点 关系 ， 再 根据 事例 所 属 时 间 段 标记 进行 GPS 时 间 计 算 。 

GPS 时 间 的 误差 为 随机 误差 ， 短 时 间 的 稳定 性 不 好 ,但 是 长 期 稳定 性 比较 好 ， 与 之 相反 的 是 本 地 
时 间 的 短期 稳定 性 好 ， 长 期 存在 时 间 漂 移 。 当 积累 相当 的 GPS 信号 后 ， 其 误差 趋 于 0， 这 样 比较 容易 
得 到 晶振 的 周期 ， 并 可 以 长 期 刻画 晶振 的 时 间 漂 移 。 

1A 级 过 程 解析 的 量 均 为 整数 ， 需 要 将 其 转换 为 实际 对 应 的 物理 量 或 者 将 转换 系数 写 人 文件 ， 本 
文 建议 采用 后 者 的 方式 。 

3.2 EHK 文件 的 产生 

卫星 下 传 的 轨道 和 姿态 数据 不 能 完全 表征 卫星 运行 的 空间 环境 ， 需 要 产生 EHK 文件 。EHK 文件 
描述 载荷 运行 的 空间 环境 等 ， 主 要 作用 是 将 卫星 运行 的 高 本 底 区域 、 视 场 遮 挡 区 域 、 载 荷 指 向 不 稳定 
区 域 描述 出 来 。 这 个 文件 按 一 定 的 时 间 间 隔 记 录 ， 主 要 内 容 包 括 : (1) 卫 星 的 位 置 、 姿 态 及 指向 ; 
(2) 地球 边界 与 视 场 的 关系 ; (3) 指 问 的 晃动 ; (4) 卫星 所 在 的 地 磁 截 止 刚 度 ; (5) 卫星 与 南大 西洋 异 
常 区 的 关系 ; (O 卫星 的 指向 与 太阳 、 月 球 的 关系 等 。 这 些 量 的 具体 定义 可 以 参照 各 个 科学 卫星 发 布 
的 数据 产品 ， 需 要 说 明 的 是 ， 卫 星 的 指向 是 对 大 量 瞬时 指向 平均 化 的 结果 。EHK 文件 产生 依赖 于 
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轨道 文件 、 姿 态 文件 、 地 磁 截 止 刚度 文件 、 南 大 西洋 异常 区 文件 以 及 跳 秒 文件 等 。 
4 IC 级 数据 处 理 过 程 


这 个 过 程 主要 对 数据 文件 进行 合并 和 拆 分 ， 并 对 数据 进行 一 定 的 处 理 ， 比 如 排序 、 好 时 间 段 选择 
计算 、 坏 探测 器 剔除 等 。 中 能 X 射线 望远镜 在 DA 级 过 程 中 产生 的 事例 按 独 立 探 测 模块 分 开 ， 每 一 个 
独立 单元 的 数据 按时 间 排 序 ， 但 是 在 此 过 程 中 所 有 单元 的 数据 需要 按时 间 顺 序 合并 ， 可 以 利用 合并 排 
序 算法 ， 而 伽 玛 暴 偏振 探测 仪 按 触发 包 进 行 组 织 ， 没 有 排序 过 程 。 好 时 间 段 主要 考虑 载荷 的 关机 时 间 
或 者 降 高 压 等 时 间 、 过 南大 西洋 异常 区 时 间 等 ， 一 些 损坏 的 探测 器 产生 的 数据 需要 剔除 。 

数据 文件 的 获取 采用 数据 库 查 询 ( 比如 mysql HGE 的 方法 ,将 1A、1B 级 产生 的 文件 名 称 及 
属性 写 和 数据库， 其 中 属性 包括 了 文件 开始 的 时 间 及 结束 时 间 、 文 件 类 型 (EVTFAHKFAEHKF 等 ) 、 
级 别 ( A/B) 及 路 径 等 。 给 定 一 种 数据 类 型 及 观测 的 起 止 时 间 即 可 从 数据 库 中 将 所 有 的 与 此 类 型 相符 、 
且 时 间 有 交集 的 文件 查询 出 来 ， 然 后 对 这 些 文件 中 的 事例 进行 筛选 、 排 序 及 处 理 。 

这 一 过 程 中 还 可 能 包含 数据 格式 的 转换 ， 比 如 提取 ROOT 的 数据 ， 在 处 理 的 同时 转 为 天 文 分 析 常 
用 的 FITS 格式 ， 并 将 一 些 关键 信息 ， 比 如 文件 的 起 始 时 间 、 观 测 位置 等 作为 关键 字 '” 写 人 输出 文件 。 


5 总 结 

数据 预 处 理 是 天 文 卫星 数据 处 理 环节 中 比较 重要 的 一 步 ， 它 是 数据 标定 和 数据 分 析 的 基础 。 不 同 
载荷 的 数据 处 理 细节 也 不 尽 相 同 ， 但 是 大 都 遵循 同样 的 步 又 ， 有 具体 实现 也 有 彼此 参考 的 价值 。 本 文 在 
实现 步骤 上 ， 载 荷 获 取 的 科学 数据 经 过 解 包 和 处 理 、GPS 时 间 计 算 以 及 文件 的 合并 和 拆 分 。 载 荷 工 程 
数据 主要 经 过 解 包 ， 平 台数 据 则 需要 经 过 解 包 和 计算 ， 生 成 EHK 文件 ， 有 些 卫 星 考虑 到 EHK 与 其 它 
文件 的 相关 性 ， 而 将 其 产生 步 又 放 到 后 续 处 理 中 。 这 些 过 程 中 ， 还 要 考虑 物理 量 的 转换 及 步 又 之 间 的 
依存 。1A 及 1B 文件 原则 上 一 一 对 应 ， 这 可 以 保证 文件 的 追溯 性 ， 而 1C 的 文件 根据 用 户 需要 进行 拆 
分 和 合并 ， 比 如 需要 一 轨 数 据 还 是 需要 一 天 的 数据 ， 用 户 只 需 指定 起 止 时 间 即 可 。 实 现 细节 上 ， 数 据 
解 包 采 用 配置 文件 方式 描述 数据 结构 ， 这 一 设计 在 软 硬 件 之 间 建 立 桥梁 ， 可 以 比较 好 地 弥补 设计 初期 
的 一 些 不 稳定 因素 。 数 据 处 理 中 提出 以 特殊 事例 之 间 的 数据 为 处 理 单元 ， 处 理 中 采用 前 向 、 后 向 分 别 
处 理 ， 这 尽管 损失 一 些 计算 效率 ， 但 是 提高 了 处 理 的 正确 性 ， 并 极 大 地 使 用 数据 信息 ， 尽 可 能 将 所 有 
事例 考虑 在 内 。GPS 计算 中 ， 利 用 GPS 的 长 期 稳定 性 ， 通 过 建立 GPS 时 间 与 本 地 时 间 的 对 应 点 及 对 
应 段 关 系 ， 从 而 利用 这 些 关 系 计算 GPS 时 间 。 数 据 存储 采用 了 “总 分 总 ”的 形式 ， 比 如 中 能 X 射线 
望远镜 的 科学 数据 源 包 是 包括 所 有 单元 的 ， 解 包 后 按 单元 分 开 ， 文件 合并 时 再 对 这 些 单元 的 数据 合 
并 ， 这 样 做 是 为 了 不 同文 件 合并 时 ， 首 先 按 单元 合并 ， 再 利用 排序 将 不 同 单元 的 数据 合并 。 

本 文 没 有 涉及 这 些 步骤 的 调度 ， 特 别 是 处 理 数 据 之 间 的 依存 关系 ， 同 时 也 没有 涉及 标定 及 以 后 的 
数据 分 析 工 作 。 
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Abstract; The data obtained from astronomical satellite is telemetered to ground and converted into high 
products (such as energy spectra and light curves) for further analysis. In one of these steps, data preprocessing 
is a very important step. This work will take the Media Energy X-ray Telescope ( ME) on the Hard X-ray 
Modulation Telescope satellite and the Gamma-ray Burst Polarimeter-POLAR on Tiangong-2 ( TG-2) as examples 
to introduce the method of data preprocessing. In this work, we present a standard data flow for astronomical 
satellite, and also introduce how to use configure file to decode data and how to calculate the local time of the 
payload and GPS time. This is helpful to establish data preprocessing system for other astronomical satellites. 
Key words: Data preprocessing; Satellite data; Packet decoding; Time calculation 


